Digitale Tontechnik im Studio 


Grundfragen eines Standards fur digitale Tonsignale 


Digital-Schallplatten, digitale Tonaufzeichnung und Ubertragung 
gehoren zweifellos zur Entwicklung der Audiotechnik in den 80er 
Jahren. Doch bevor die Endprodukte vielleicht als ,, Super-HiFi™ 
auf den Markt kommen, sind wichtige und nicht ganz einfach 
Normungsfragen zu kldren. Sie waren das erste Thema einer 
_Diskussions-Sitzung der Nachrichtentechnischen Gesellschaft 
NTG im Berliner Heinrich-Hertz-Instinut, wahrend der auch noch 
die Analog/Digital- und Digital/Analog-Wandlung sowie Auf- 
zeichnung und Bearbeitung behandelt wurden. Hier das Wichtigste 
aus dem Beitrag von Byj6rn Bliithgen, Poylgram_ Hannover, tiber 
Grundfragen zur Festlegung eines Standards. 


Digitale Tontechnik im Studio betrifft drei Hauptanwendungs- 

bereiche: . 

— den Einsatz zur operationellen Unterstiitzung des Studioper- 
sonals durch elektronische Abmischcomputer oder Routing- 
felder, : 

— die Anwendung in Peripheriegeraten zur Nachhallerzeugung 
und fiir spater erwartete rein digitale Mischpulte und 

~ die digitale Tonaufzeichnung.Die Erkenntnis der Notwendig- 

keit von weltweit kompatiblem Programmtrageraustausch machte 

die digitale Tonaufzeichnung mit den daran beteiligten Parame- 
tern, wie Abtastfrequenz und Fehler-Korrekturverfahren, zum 

Hauptthema. 

Viele Beteiligte gingen dabei von der Idealvorstellung einer 

Standardisierung nach vorheriger Absprache anhand teilweise 


)theoretischer Voraussetzungen aus, wie zum Beispiel die Diskus- 


sion um die Abtastfrequenz deutlich zeigte. 

Doch ein Vorschlag zur Veroffentlichung als Standardempfeh- 
lung tiber das nationale Normungsgremium dem IEC’) vorgelegt, 
muB sich jedoch auf eine realisierte Geraéteausfiihrung beziehen. 
Von mehr als einem Land eingereichte unterschiedliche Vor- 
schlage zum gleichen Anwendungsfall ké6nnen dann durch die 
IEC harmonisiert werden. Die AES*) kann dabei als Design 
Commitee oder Plattform fiir Gesprache zwischen Hersteller und 
Anwender fungieren. 

Eine Untersuchung von existierenden Quellencodier-Charak- 
teristiken zeigt nach einem Auszug aus dem Sekretariatsbericht 
der IEC Working Group 15, Digital Audio Recording, daB eine 
gewisse Praxis besteht, und daB zwei schon in Gebrauch befindli- 
che sowie zwei in der Entwicklungsphase stehende Recorder 
1. eine Abtastfrequenz von 50 kHz 
2. fiir die Quantisierung — 16 bit linear 
3. den ,,Zweier Komplementdér Bindr Code“ und 
4. keine Quellencodier-Entzerrung anwenden oder vorsehen. 
Damit sind 50 kHz aber noch nicht als Standard empfohlen! 


') IEC = International Electrotechnical Commission. 
7) AES = Audio Engineering Society. 
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Diskussionen mit renommierten Recorder-Herstellern und 
Studios mit taglicher Vielspurrecorder-Erfahrung ergibt etwa 
folgendes Bild 

Ampex hat sein friiher verGffentlichtes Konzept zur Datenfor- 
matierung verworfen und will Ende 1980 eine verbesserte Ver- 
sion in Stereo-Ausfithrung auf den Markt bringen. Man sieht dort 
die Rundfunkstationen als einen ergiebigeren Markt (gegeniiber 
nur wenigen teuren Multitrackrecordern fiir einzelne professio- 
nelle Studios). 

MC/ baut in Kooperation fir EMI, England. eine gréBere 
Auftragsserie. wenn die Tests anhand von 2 ausgelieferten 
Prototypen bei EMI. London, abgeschlossen sind. Auch dies sind 
Stereo-Recorder. EMI beabsichtigt damit. die urspriingliche 
Qualitét von analogen Multitrack-Abmischungen auf Digital- 
Stereo in allen Produktionsstufen weltweit zu erhalten. 


Aus der Codierungspraxis: 50 kHz und linear 
mit 16 bit codiert. 


3M mit je einem 32- und 4-Spur-digital-Recorder in bereits 5 
Studios (die Zahl wird schnell zunehmen) bei taglichem Betrieb. 
will seinen ,.Standard** durch Fakten durchsetzen. Der friiher mit 
Bildschirmterminal arbeitende Prototyp fiir elektronisches Edi- 
ting wurde wegen nicht praxisgerechter Arbeitsweise verworfen 
und dafiir ein vorerst einfacher Editor ohne weiches .,Cross- 
fade*) bei Signal-Einblendungen vorgestetlt. Random Punch- 
Ins+) an tieffrequenten Signalen sind teilweise leicht hérbar 
(40 “). jedoch konnen unhGrbare Schnitte durchgefiihrt werden. 
Ein im Crossfade weiter verbesserter Editor*) wird fiir Mai 1980 
erwartet. 

Ein Digital-Audio-Stereo-Recorder, der fiir sich beansprucht. 
neben dem elektronischen Schnitt auch mechanische Schnitte und 
Aufnahmen auf Bandern mit Klebestellen zuzulassen. wurde von 
Mitsubishi vorgestellt. Hier wird trickreich die zeitliche Koinzi- 
denz von Dropouts auf mehreren Datenspuren sowie auf der 
Kontrollspur fiir weiche, interpolativ abgeleitete Signaliiberblen- 
dungen ausgenutzt. Die Starke des Fehler-Korrekturverfahrens 
liegt in der Anzahl von 4 Datenspuren pro Audiosignal, wobei die 
Sample-Segmente zusdatzlich zeitlich verschachtelt (interleaved) 
sind. 


3) Crossfade = (Schnittstellen-)Uberblendung. 
*) Random Punch-Ins = Programm-Einblendungen an beliebiger Stelle. 
‘) Editor = Schnittstellen-Prozessor. 
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Man wird kaum eine derartige Technik auch fiir Multitrack- 
Ausfiihrungen erwarten kénnen, da die Gkonomische Fertigung 
von zum Beispiel 96-Spur-Kopftragern fiir 24-Spur-Recorder 
erhebliche Schwierigkeiten bereiten wird. Auch die Problemlé- 
sung mittels Diinnfilm-Technik ist fraglich, wenn von glaubwiirdi- 
ger Seite 6/10 Ampere pro Impuls, also etwa 58 A fiir 24 Audio- 
Kanile, als erforderlich bezeichnet werden (St6rstrahlung!). 

Sony iiberraschte mit einem tragbaren 4-Kanal-Recorder fiir 
'/,-Zoll-Band-Material, dessen mechanisches Konzept auch ftr 
eine 24-Spur-1-Zoll-Ausfiihrung gelten soll. Wahrend der '/.- 
Zoll-Typ mit 2 Datenspuren pro Audiosignal eine Bandgeschwin- 
digkeit von nur 38 cm/sec bendtigt, werden die Multitrack- 
Recorder je Audiosignal nur eine Datenspur erhalten, dabei 
jedoch 76 cm/sec Band bei einer nominalen Abtastfrequenz von 
50.4 kHz verbrauchen. 


Die Lo6sung hangt von den Bandpassen im 
Codec ab. 


Gespriache mit Anwendern iiber Erfahrungen an den verschie- 
denen Recordern in der Praxis (3-M. Sony und Soundstream) 
bestatigen die an die Digitaltechnik gestellten Erwartungen 
‘¥nsichtlich Klangverbesserung, wobei aber vereinzelt geauBerte 
subjektiv unterschiedliche Bevorzugung der verschiedenen 
Codecs‘) eine nahere Untersuchung der Ursachen empfiehlt. 
Interessant war auch tiber die Qualitatsverbesserung bei 16 Bit 
Linear-Quantisierung zu h6ren. wenn der zu ibertragende 
Abtastwert mittels Integration aus einem Vielfachen der Abtast- 
frequenz auf die 18 Bit entsprechende Qualitaét gebracht wird. 
Fir die Harmonisierung der Grundparameter fiir eine interna- 
tionale Bandaustauschbarkeit soll ein von Anwendern den Her- 
stellern vorgelegter Fragenkatalog als Arbeitsgrundlage dienen. 
Der Fragenkomplex ftir die Austauschbarkeit der Bander betrifft: 
a) die freie Austauschbarkeit bespielter Bander 
b) den Bandverbrauch 
c) den Programm-Schnitt, die klangtechnische Bearbeitung 
sowie Inserttechnik 
d) den Recorderabgleich und erforderliche Servicearbeiten 
e) die Schnittstellenbedingungen fiir den Anschlu8 peripherer 
Gerate 
f) das Speichern von Tonprogramm-Kontrollsignalen. 


Dreimal Digitalaudio fur Rundfunk- 
Ubertragungsketten, kompatibel mit dem 
Fernsehton und als Tonkonserve fur den 
Endverbraucher. 


Neben der Frage der Bandaustauschbarkeit sind weitere von 
grundsatzlicher Bedeutung und fiir eine Harmonisierung unter 
wirtschaftlichen Gesichtspunkten offen. Diese beziehen sich auf 
Horbarkeitsgrenzen, den Stand der Technik, die Gerétekosten 
sowie Umwelteinfliisse, wie maximal/minimal zulassige Umge- 
bungstemperaturen, Liiftergerdusche und elektrische St6r(ein)- 
strahlungen. 

Die Wahl der Abtastfrequenz als ein Hauptdiskussionspunkt 
(ein Sony-Prototyp verarbeitet 7 verschiedene Frequenzen) sollte 
somit auch logischen Gesichtspunkten entsprechen und nicht 
nach Energie verschwendenden, einzeln aus dem Zusammenhang 
gezogenen, nicht stichhaltigen Werbegewohnheiten erfolgen. In 
der digitalen Ebene eines Programmkanals ist zum Beispiel nicht 
mit der Zunahme von Gruppenlaufzeitverzerrungen in der Pro- 
duktionskette zu rechnen. Wie erneute detaillierte Untersuchun- 


*} Codec = Coder-Decoder-Kombination. 
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gen von JVC (siehe AES-New York 79) wiederum bestatigten, 

sind 15 kHz HG6rbandbreite fiir abgemischtes Programm-Material 

vollig ausreichend. 

Fir welche Anwendungszwecke sollte eine hohere Abtastfre- 
quenz dennoch moglich sein? 
1.)Beim Hintereinanderschalten von mehreren Codecs, aber 

wieviel Codecs sollen mindestens ohne signifikante Qualitats- 
einbuBen hintereinander schaltbar sein? 

2.) Fiir ,,Over-Dubbing‘’) wie fiir die mehrstimmige Aufnahme 
eines Sdngers mittels reduzierter Wiedergabegeschwindigkeit 
und anschlieBender ,,Synchron’-Aufnahme mit verringerter 
Abtastfrequenz, werden bis zu — 10 % der Nominalgeschwin- 
digkeit ohne hérbare Aliasing-Produkte®) gefordert. 

Die Antworten hierzu sind abhadngig von der praxisgerechten 

Losung der im Codec notwendigen Bandpassprobleme. 

Das Eingangs-Tiefpassfilter mu8 spektrale Tonfrequenzanteile 
und zum Beispiel Ubersprechkomponenten von peripheren Geri- 
ten mit abweichender Abtastrate oberhalb der Horbandbreite 
ausreichend unterdriicken ebenso wie auch Ausgangs-Tiefpassfil- 
ter das Entstehen von Aliasing-Produkten vermeiden sollen. Eine 
Apertur-Korrekturentzerrung ist ebenfalls zur Kompensation der 
den Abtast- und Halteschaltungen typischen Bandpasseigenschaft 
erforderlich. Weiterhin kénnen fiir einige Anwendungsfalle Pre-/ 
Deemphasis-Filter vorteilhaft sein. 

Zu den Grundfragen aus dem Bereich der Filterprobleme 
gehort die nach einem Untersuchungsbericht tiber die Griinde der 
Forderung nach 20 kHz ohne relevante hérbare Eigenschaften. 
Auch ist zu fragen, welche technischen, 6konomischen oder vom 
Marketing abhangigen Griinde heute eine Abtastfrequenz von 32 
kHz fiir ein 15-kHz-Endprodukt unzweckmaBig erscheinen las- 
sen, Wer sollte die Verantwortung fir 20 kHz tragen, wenn nach 
Einfiihrung des direkten digitalen Satellitenempfangs der Horer 
keinen Unterschied zwischen gekauften Tontrégern (20kHz) und 
dem gleichen Rundfunkprogramm-Material (15 kHz) feststellt? 


44,056 kHz fur NTSC und 44,1 kHz fur Pal sind 
denkbar. 


Erst nach genauer Kenntnis der Filterproblem-Losungen kann 
die erforderliche Abtastfrequenz logisch rationell fiir die Anwen- 
dungsbereiche festgelegt werden. 

Diese sind 
a) Rundfunk-/Kommunikations-Ubertragungsketten (32 kHz) 
b) Fernsehton-Kompatibilitat mit Pal-NTSC und professionellen 
Audio-Recording-Studios (44 056/50,0 kHz) 
c) Vorbespielte Tontrager als Verbraucher-Endprodukt mit der 
Forderung nach Fidelity, Spielzeit und (Material)Preis. 
Nach den vorliegenden Untersuchungsergebnissen tiber 15 kHz 
als ausreichende Bandbreite kann ohne eine sachliche Analyse 
der Antworten auf die bisher gestellten Fragen nicht mit einer 
einzigen Standard-Abtastfrequenz gerechnet werden. Mehr als 
zwei Frequenzen werden komplexe Probleme fiir Transcoder, 
Filter von miteinander verkoppelten Geraten (Recorder/Periphe- 
rie mit Mischpult...) erzeugen. Nicht zu unterschatzen ist auch 
der sachgerechte Einsatz von (untbersichtlichen) ,,Black-Boxes* 
fiir Transcoder-Zwecke durch tiberlastetes Studio-Personal. 

Digitale Echtzeit-Abtastfrequenz-Transcodierung f,/f, durch 
Interpolation eines integeren Verhdltnisses (M) und einer Teilung 
durch das integere Verhaltnis (N) erfordert heute keinen wesent- 
lichen Mehraufwand innerhalb eines gewissen Filter-Koeffizien- 
tenbereiches. 


7) Over-Dubbing = Synchron-Aufnahmevorgang zusatzlicher Tonsignale zu 
bereits bespielten (Takt-)Spuren eines Mehrspurbandes 


*) Aliasing-Produkte = Mischprodukte zwischen codiertem Signal und Abtast- 
frequenz. 
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Damit wird die Frequenzwahl erleichtert. Entsprechend den 
bisherigen Ausfiihrungen sollte eine Abtastfrequenz fiir den 
professionellen Bereich, falls wirklich notwendig(?!) so niedrig 
wie mdéglich gewdhlt werden. Der Bereich oberhalb 45 kHz 
erscheint zumindest langfristig gesehen als nicht erforderlich. 

Auch mit Riicksicht auf einen spiteren Ubergang vom Video- 
recorder zur Longitudinal-Recordertechnik bleibt die Pal/NTSC- 
Kompatibilitatsforderung bestehen. Mit einem unhodrbaren Ton- 
héhenunterschied von 0,1 % und einer fiir Einzelfalle externen 
Recorder-SynchroniermOéglichkeit kénnte das Frequenzpaar 
44,056 kHz fiir NTSC und 44,1 kHz (oder 44 kHz) fiir Pal 
nebeneinander bestehen. 

Dynamische Quantisierungsrauschwerte (Verzerrungen) am 
Ende einer digitalen Ubertragungskette werden grundlegend mit 
der Elementanzahl/Abtast-Codewort (gleichformiger Code) 
bestimmt. Weitere Rauschquellen entstehen durch physikalische 
Grenzen bei der A/D-D/A-Wandlung. Daher miissen Minimal- 
anforderungen fiir diese Wandlerstufen getrennt und auch als 
Codec betrachtet fiir die professionelle Anwendung definiert 
werden. Dabei hat man sich auch zu fragen: 

1. Welche Gerduschme8methode fiir digitale Signalitbertragung 
definiert Minimalwerte fiir Dynamik-:Frequenzabhangige 
Quantisierungs-Nebenprodukte? 

2. Welche Minimalwerte gelten fiir professionelle Signaltibertra- 

gung. 

/ 3, Welche Umgebungstemperatureinfltisse sind bei Wandlern zu 
beriicksichtigen? Ist eine 14-Bit-Quantisierung mit etwa 90 
dB Abhorlautstarke im Regieraum abgehort fiir Nachhallaus- 
klaénge ausreichend? 

4. Was sind im Gegensatz zur Theorie die in der Praxis erreich- 
ten Gerduschunterschiede zwischen 14- und 16-Bit-Codecs? 

5. Welche (signifikant zu beweisenden) Vorteile hat ein in seinen 
dynamischen Eigenschaften ungenauer 16-Bit-Codec gegen- 


‘ 


iiber einer erheblich genaueren 14-Bit-Ausfiihrung oder 
6. wenn 14-Bit-Abtastwerte mit der Frequenz (x) tibertragen 

mittels Integration aus f, 4 Abtastwerten eine 16-Bit- 

Qualitaét ergeben? 

Eine nicht hérbare Datenreduktion wird auch in der Studio- 
Technik wirtschaftliche Vorteile mit langeren Spielzeiten, verrin- 
gerter Packungsdichte (Fehlerwahrscheinlichkeit) oder weniger 
aufwendigen Verz6gerungsleitungen eingesetzt werden. Die kon- 
stante Elementmenge’‘Ubertragungs-Codewort ist unerlaBlich 
zum einfachen. nicht zusatzlich Fehlerquellen verursachenden 
Datendekodieren. Besonders von der EBU’) sind dafiir verschie- 
dene Verfahren mit fiir den Konsumbereich ausreichender Quali- 
tat verdffentlicht worden. 

Fiir die Studiotechnik konnte auch das folgende Reduktions- 
verfahren mit gleichformiger PCM-Ubertragungsqualitat vielver- 
sprechend sein: Binaére PCM-Augenblickswertdifferenzen ent- 
sprechen codierten ,,Slew-Rate’-Werten!°), die unregelmaBig 
verteilt und statistisch ermittelt nur selten auftreten. Kennlinien 
fiir konstante Amplitudendifferenz/Anderungsschnelle (Fre- 
quenz)-Werte entstehen, ausgehend von der maximalen Quanti- 
sierfahigkeit eines A/D-Wandlers bei der Abtastfrequenz (f,) in 6 
dB-Pegelstufen je reduziertem MSB'') bei gleichzeitig stufen- 
weise halbierter Abtastfrequenz (f,) (als Eckwert fiir die obere 
Frequenzgrenze, bis zu der nach dem Verfahren garantiert jeder 
,-Slew-Rate’’-Wert tbertragen wird.). 

Der hier skizzierte Fragenkatalog ist nur ein Rahmenpro- 
gramm zu logischen Annaherung an eine harmonisierte Digital- 
Studio-Technik. Die aktive Beteiligung an der Losung einzelner 
Problemgruppen ist fiir alle am Erebnis interessierten Firmen und 
Institutionen unerlaBlich. 


“) EB = European Broadcasting Union. 
)  Slew-Rate = Amplituden-Anderungsgeschwindigkeiten. 
') MSB = Most Significant Bit. 
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